Introduccion
El acceso al microcredito en contextos donde el apoyo financiero no esta disponible para las personas marginadas puede ser una politica importante para apoyar el bienestar de las poblaciones vulnerables. Una pregunta importante, sin embargo, es como seleccionan mejor las instituciones a las personas a quienes otorgar credito y, lo que es mas importante, si hay formas en que puedan apoyarlas para que tengan exito.
En este proyecto, abordaremos estas dos preguntas al identificar las caracteristicas comunes que comparten los microempresarios exitosos utilizando un gran conjunto de datos historicos de una institucion de microcredito y al crear intervenciones para apoyar y promover algunas de estas caracteristicas procesables en otros prestatarios de microcreditos. Para ello, nos asociamos con la Fundacion BBVA, institucion que esta presente a traves de diferentes entidades en varios paises de America Latina y otorga microcreditos a emprendedores vulnerables. Las contribuciones esperadas de este proyecto son identificar y generar evidencia relacionada con algunos de los determinantes del exito en el contexto de los microcreditos, y determinar como las instituciones pueden apoyar a las personas para ayudarlos a tener exito en sus negocios. Tambien esperamos arrojar luz sobre otras caracteristicas que podrian ser utiles a la hora de elegir aprobar o no un credito, lo que podria ser particularmente importante para poblaciones frecuentemente marginadas.
Estudiaremos los determinantes del exito en el contexto de cuatro paises diferentes de America Latina con un gran conjunto de datos de millones de microempresarios a lo largo de los anos. Esto brinda una oportunidad unica para analizar informacion a nivel individual en un area donde los datos suelen ser escasos. La mayoria de las personas de nuestra muestra provienen de entornos marginados, muchas veces sin acceso al credito a traves de instituciones privadas, y de areas rurales en sus respectivos paises. Si bien nuestro analisis se centrara en America Latina, esperamos que algunos de estos resultados puedan generalizarse a otras poblaciones del mundo, dado que los pequenos empresarios a menudo enfrentan desafios similares.
El estudio se divide en dos fases: (1) identificacion de las caracteristicas asociadas con el exito y (2) intervenciones destinadas a mejorar las posibilidades de exito. La idea principal es que la fase 1 de este estudio informa las intervenciones para la fase 2. En particular, este reporte se refiere a los resultados de la primera parte del estudio (fase 1).
La primera parte del estudio (fase 1) sera retrospectiva. Nos enfocaremos en los clientes existentes para identificar las caracteristicas que estan asociadas con el exito, medido tanto como el pago oportuno del credito, asi como el aumento de sus activos y negocios en general. En terminos de datos, esta fase del estudio se basa en datos historicos proporcionados por la Fundacion BBVA desde 2013 hasta 2021. Este es un conjunto de datos unico ya que contiene millones de clientes de microcredito en America Latina. Lo complemetamos con encuestas aplicadas a una muestra representativa de clientes existentes (n = 2,200). Utilizando estos datos, identificaremos caracteristicas compartidas para el grupo categorizado como individuos “exitosos” y dividiremos estos atributos en categorias procesables y no procesables. Aunque las caracteristicas identificadas en la fase 1 no proporcionaran evidencia causal de los determinantes del exito, ayudaran a informar el diseno de diferentes intervenciones que se probaran en la segunda parte de este estudio (fase 2).
Seleccion de Muestra y Diseno Encuestas
En base a los datos entregados por la Fundacion BBVA, se categorizaron a los clientes en base a su nivel de exito (e.g. Exitoso, No Exitoso, Un credito, Sin informacion). Para los clientes con mas de un credito, fueron categorizados como exitosos aquellos microemprendedores sin mora y cuyo capital habia crecido entre un credito y otro credito; de igual forma, clientes con mora o sin crecimiento fueron categorizados como no exitosos. Se incluyo tambien en la muestra una lista reducida de clientes que las oficinas calificaron como Exitosos segun sus propias medidas, siendo clasificados como exitosos subjetivos. A continuacion se describen las categorias utilizadas en el analisis, donde todos las categorias a excepcion de “No exitoso” son considerados “Exitosos”:
- Exitoso (mas de un credito): Cliente con mas de un credito entre 2018 y 2020, sin mora y cuyo capital crecio entre el primer credito y el ultimo.
- No exitoso: Cliente con mas de un credito entre 2018 y 2020, y que estuvo moroso en el periodo o cuyo capital no crecio entre el primer y ultimo credito.
- Un credito: Clientes con un solo credito entre 2018 y 2021 que no contaron con mora durante el periodo de estudio. Esta categoria se refiere potencialmente a clientes “fugados”.
- Subjetivos: Clientes propuestos por cada oficina local de los microemprendedores que ellos consideran exitosos.
Las encuestas se realizaron en 4 paises de America Latina (Colombia, Panama, Peru, y Republica Dominicana), con aproximadamente 600 encuestas en cada pais, con excepcion de Panama, donde solo se realizaron 400 encuestas4. Para lograr representatividad en cuanto a los tipos de clientes, se tomaron muestras representativas de las distintas categorias (con excepcion de los subjetivos, que eran propuestos directamente por las oficinas), estratificados tambien por su area de negocio (Agricola o No Agricola). La muestra fue seleccionada tambien de manera representativa en terminos de geografia, para abarcar distintas zonas del pais.
A continuacion se muestran los resultados agregados para todos los paises.
Resultados
Descripcion general
En total, se realizaron 2125 encuestas en todos los paises como muestra el siguiente mapa interactivo. En el caso de Colombia, se realizaron 524 encuestas en diversas zonas del pais, como muestra el siguiente mapa. Varias encuestas se concentran en Bogota y Medellin, pero otras zonas del pais tambien fueron cubiertas. En Panama, se completaron 400 encuestas, tanto en la zona este como la zona oeste del pais. En Peru, se realizaron 596, principalmente en Lima, pero tambien en varias zonas rurales. Finalmente, en Republica Dominicana 605 clientes respondieron la encuesta.
Figura 1. Localizacion geografica de encuestas en distintos paises
Las encuestas fueron estratificadas segun diferentes categorias: Exitoso, No exitoso, Un contrato, y Subjetivos. Ademas, dichas categorias fueron separadas segun el tipo de actividad del cliente (agricola o no agricola). La siguiente tabla muestra el numero de encuestas por categoria:
| Categoria | N Encuestas |
|---|---|
| Exitoso - Agro | 124 |
| Exitoso - No Agro | 724 |
| No Exitoso - Agro | 193 |
| No Exitoso - No Agro | 598 |
| Subjetivo | 45 |
| Un Contrato - Agro | 85 |
| Un Contrato - No Agro | 356 |
El trabajo de campo se realizo entre Junio 2022 y Enero del 2023, con un peak de encuestas en Octubre. Si bien la mayor parte del trabajo de campo se realizo en la mayoria de los paises entre Septiembre y Noviembre, hubo ciertas variaciones dependiendo del pais5.
Figura 2. Fechas de aplicacion de encuesta
Respecto a la caracterizacion de los clientes que respondieron la encuesta, estos tienen en promedio 47, con un rango entre 20 y 80 anos de edad.
Figura 3. Distribucion de edad de los participantes
En general, tienen un nivel educacional bajo, donde la mayoria alcanzo un nivel de educacion secundaria o menor. Si bien la distribucion entre los grupos Exitosos y No Exitosos es similar, hay una leve diferencia en educacion primaria y educacion superior, donde los clientes clasificados como Exitosos tienden a completar mayores niveles de educacion. Tambien se observa una heterogeneidad importante entre paises: Peru cuenta con clientes con mayor nivel educacional, mientras que en Republica Dominicana cerca de un cuarto de la muestra no reporta informacion educacional o reporta alguna otra alternativa.
Figura 4. Nivel educacional de los participantes segun clasificacion de Exito
Figura 5. Nivel educacional de los participantes por pais
En cuanto a las areas de los negocios, los clientes que respondieron la encuesta se dedican principalmente al comercio al por menor, seguido por el negocios agricolas y servicios:
Figura 6. Areas de negocio de participantes
Definicion de Exito
La gran mayoria de los clientes se considera exitoso (0.9%), mientras que un porcentaje menor no se considera dentro de esta categoria (2%).
Figura 7. Se considera ud. exitoso?
Se les pregunto a los clientes de manera abierta por que se consideraban exitosos, y la mayoria dio argumentos asociados al trabajo, logros y metas. La siguiente figura muestra una nube con las palabras mas frecuentes en dicha respuesta. De los pocos clientes que declaran no considerarse exitosos, las palabras que mas se repiten se refieren a metas, faltas, proyecto, e incluso la pandemia.
Figura 8. Nube de palabras para razones por las que se consideran exitosos/as
Para los pocos clientes que responden que no se sienten exitosos, la mayoria declara que se considerarian exitosos si es que lograran que su negocio fuera estable.
Figura 9. Para los que no se consideran exitosos - Se consideraria exitoso principalmente si antes de 5 anos…
Para finalizar esta seccion, se les pregunto a los participantes que hace exitoso/a a una persona o a un negocio. La misma proporcion de personas asocia el exito personal a la estabilidad del negocio como a la estabilidad del hogar. A la vez, cerca de un tercio de los clientes consideran que el exito de un negocio recae en su crecimiento. Dichas respuestas son similares entre los clientes categorizados como exitosos y no exitosos, aunque clientes no exitosos tienden a darle mayor importancia al reconocimiento por la comunidad y al hecho que el negocio permita cubrir necesidades del hogar.
Figura 10. Percepcion de persona y negocio exitoso
Figura 11. Percepcion de persona y negocio exitoso por categoria
Factores de Exito
Para analizar potenciales factores de exito, se les pregunto a los participantes que harian con los beneficios de su negocio. La gran mayoria de clientes categorizados como exitosos como tambien los no exitosos respondieron que reinvertirian esas ganancias en su negocio. Alrededor de un tercio de los participantes declaran que usuarian esas ganancias para invertir en el hogar o pagar deudas. La distribucion de respuestas es similar entre las dos categorias de exito.
Figura 12. Cuando usted tiene beneficios en su negocio generalmente…
Segun las respuestas de la encuesta, los participantes tienden a ser mas optimistas que pesimistas, y una mayor proporcion es menos aversa al riesgo. En cuanto a diferencias entre exitosos y no exitosos, las respuestas tienden a ser similares, con una propension al riesgo levemente mayor para los clientes clasificados como no exitosos.
Figura 13. Preguntas acerca de optimismo y riesgo en los negocios
Figura 14. Preguntas acerca de optimismo y riesgo en los negocios segun categoria de exito
Juegos de Riesgo
Finalmente, al finalizar la encuesta, se les pregunto a los encuestados si es que deseaban responder un par de preguntas adicionales que les permitirian ganar dinero real. Si es que aceptaban, el encuestador procedia con tres juegos distintos, y si es que no aceptaban, se les entregaba una cantidad fija de pago por su participacion.
Los juegos realizados tienen como objetivo identificar el nivel de riesgo que los clientes estan dispuestos a tomar. Para cada pais se dieron premios correspondientes en la moneda local, con un valor esperado de los premios de alrededor de US$7.
Juego I - Aversion al riesgo
El primer juego consiste en darle la opcion al encuestado de escoger entre un valor fijo o un premio que depende del resultado de una moneda. El valor esperado del premio para cada opcion es practicamente constante, pero la varianza aumenta a medida que se avanza en las opciones. Los escenarios eran los siguientes:
- (A): $5 seguro o (B): $4 si sale cara o $6.5 si sale sello
- (A): $5 seguro o (B): $3 si sale cara o $8 si sale sello
- (A): $5 seguro o (B): $2 si sale cara o $10 si sale sello
- (A): $5 seguro o (B): $1 si sale cara o $12 si sale sello
- (A): $5 seguro o (B): $0 si sale cara o $13 si sale sello
Se observa segun las respuestas de los encuestados que si bien hay una distribucion bastante uniforme en cuanto al riesgo, hay un porcentaje importante (22.4%) que tiene una mayor propension al riesgo.
Figura 15. Respuestas en Juego I
Analizando las mismas distribuciones en terminos de exito, utilizamos un modelo lineal de probabilidades (LPM) para analizar la asociacion entre riesgo y exito6:
\[Exito = \beta_0 + \beta_1Risk_1 + \beta_2Risk_2 + \beta_3Risk_3 + \beta_4Risk_4+\beta_5Risk_5 + \varepsilon\] El coeficiente \(\beta_0\) representa la probabilidad promedio de un cliente de ser categorizado como exitoso si es que no toma ningun riesgo (i.e. elige la opcion de $5 fijo), mientras que \(\beta_i\) representa la diferencia en probabilidad de ser considerado exitoso entre clientes que eligen la opcion \(i\) de riesgo vs los que no eligen arriesgarse. Si es que dichos coeficientes son estadisticamente distintos de cero, indicarian que hay una diferencia significativa entre clientes que toman distintos niveles de riesgo y su probabilidad de ser exitosos.
Como se observa en los siguientes resultados, no hay una diferencia significativa entre los distintos grupos de riesgo (\(\beta_1\) a \(\beta_5\)).
Figura 16. Coeficientes LPM para aversion al riesgo
Juego II - Aversion a la perdida
En el segundo juego, se le entrega al encuestado $20 y se le da la oportunidad de ganar $10 mas. Para esto, se le muestra los siguientes 5 escenarios en los cuales tiene que escoger una de las dos alternativas (A o B). Finalmente, se selecciona de manera aleatoria la opcion que se jugara y recibe el pago de acuerdo a este resultado.
- (A): No perder nada o (B): Ganar $10 mas si sale cara o perder $20 si sale sello
- (A): No perder nada o (B): Ganar $10 mas si sale cara o perder $16 si sale sello
- (A): No perder nada o (B): Ganar $10 mas si sale cara o perder $12 si sale sello
- (A): No perder nada o (B): Ganar $10 mas si sale cara o perder $8 si sale sello
- (A): No perder nada o (B): Ganar $10 mas si sale cara o perder $4 si sale sello
En la siguiente figura se observa que los clientes que respondieron la encuesta son en gran parte aversos a la perdida. Por ejemplo, en el primer escenario (mayor riesgo) solo un 37.7% estuvo dispuesto a tirar una moneda, y solo cuando se llega al quinto escenario (menor riesgo) la proporcion de personas dispuestas a arriesgar se equipara con las que no estan dispuestas.
Figura 17. Respuestas en Juego II
En base a dichas respuestas, construimos una variable de aversion a la perdida, con niveles de 0 a 5, donde 0 representa la persona que nunca escoge lanzar la moneda, 1 la persona que decide arriesgarse en el caso menos riesgoso, etc. De la misma manera que en el caso anterior, utilizamos un modelo de probabilidad lineal:
\[Exito = \gamma_0 + \gamma_1Loss_1 + \gamma_2Loss_2 + \gamma_3Loss_3 + \gamma_4Loss_4+\gamma_5Loss_5 + \varepsilon\] donde \(\gamma_0\) representa la probabidad promedio de que una persona sea categorizada como exitosa si nunca apuesta, y \(\gamma_i\) representa la diferencia en probabilidad de ser categorizado como exitoso entre las personas que deciden lanzar la moneda en el escenario \(6-i\)7.
En este caso se observa que si bien la mayoria de los coeficientes estan en torno a 0, hay una diferencia significativa para los clientes que deciden apostar a las opciones de ganar $10 o perder $16 o incluso perder $20, las cuales son las opciones de mayor riesgo. Esto indica que clientes con menor aversion a la perdida son categorizados como exitosos con una mayor probabilidad.
Figura 18. Coeficientes LPM para aversion a la perdida
Juego III - Honestidad
Finalmente, el ultimo juego consiste en 10 rondas, donde el encuestado debe adivinar el numero que mostrara un dado. La persona debera pensar un numero entre 1 y 6, se generara el numero al azar, y despues la persona ingresara el numero que habia pensado. Si el numero es igual que el que se muestra, la persona gana $1; si no es igual, la persona no gana nada.
Este juego tiene como objetivo medir el nivel de honestidad de los participantes. En promedio, si es que los participantes responden de manera honesta, deberiamos observar una distribucion de porcentaje de aciertos en torno al valor esperado real (e.g. acertar 1 de 6 veces, en promedio, o 16.7%). Para contrastar los resultados, realizamos 100 simulaciones bajos los mismos parametros que el juego. En este caso, observamos que la distribucion observda (en naranjo) esta sesgada con respecto a la distribucion simulada. La primera tiene una cola mas larga hacia la derecha, demostrando que ciertos clientes probablemente mienten respecto a sus respuestas para obtener el dinero.
Figura 19. Respuestas en Juego II
Utilizando el porcentaje de aciertos observados menos el porcentaje esperado (16.7%), construimos una variable categorica de honestidad de la siguiente manera:
- \(Hon_0\): La persona tiene un porcentaje de aciertos igual o menor a 20%
- \(Hon_1\): La persona tiene un porcentaje de aciertos mayor o igual a 20% y menor a 30%
- \(Hon_2\): La persona tiene un porcentaje de aciertos mayor o igual a 30% y menor a 40%
- \(Hon_3\): La persona tiene un porcentaje de aciertos mayor o igual a 40%
Al igual que en los dos juegos anteriores, usamos un modelo lineal de probabilidades para identificar la asociacion entre honestidad y exito:
\[Exito = \delta_0 + \delta_1Hon_1 + \delta_2Hon_2 + \delta_3Hon_3 + \varepsilon\]
El coeficiente \(\delta_0\) representa la probabilidad promedio de un cliente de ser categorizado como exitoso si es que es clasificado como honesto (\(Hon_0=1\)), mientras que \(\delta_i\) representa la diferencia en probabilidad de ser considerado exitoso entre clientes clasificados con un nivel de honestidad \(i\) vs los que caen en la categoria \(Hon_0\).
Como se observa en los siguientes resultados, no hay una diferencia significativa entre los distintos grupos de honestidad.
Figura 20. Coeficientes LPM para aversion al riesgo
Prediccion de Exito
En esta seccion utilizaremos distintos metodos de Machine Learning para entender cuales son las variables que mejor predicen distintas definiciones de exito. El objetivo es aprovechar la data detallada de las encuestas para identificar que caracteristicas de los clientes estan mas altamente correlacionadas con exito.
Categoria Exito
En esta primera definicion de exito, utilizamos la caracterizacion inicial de la encuesta, donde clientes con mas de un credito, que crecieron entre su primer y ultimo credito, y no tuvieron demora en sus pagos son categorizados como exitosos. En este caso, se excluye a los clientes con un solo credito.
El primer modelo que utilizamos en un modelo lineal generalizado con regularizacion lasso. Esto permite seleccionar las caracteristicas que mas aportan a la prediccion de la variable de resultado sin sobre-saturar el modelo. Si bien el modelo detecta variables que son intuitivamente relevantes, cabe notar que el nivel de exactitud del modelo es bajo, con un porcentaje de clasificacion correcta de 59.4%. En este caso, las variables que mas sobresalen estan asociadas a otros creditos que la persona tomo (y no fueron aprobados o no termino de pagarlos), tambien a variables asociadas a capacitacion, refiriendose a donde el cliente ha obtenido su experiencia en negocios y tambien si estaria dispuesto a pagar por un curso.
Figura 21. Importancia relativa de variables en modelo de regularizacion lasso para prediccion de Exito
Como segundo modelo, utilizamos un algoritmo de Random Forest para identificar de manera no parametrica que variables son las que mas predicen la categoria de exito. Este modelo agrega una secuencia de arboles de decisiones, como el mostrado en la siguiente figura, aleatorizando el numero de predictores usados en cada caso:
Figura 22. Ejemplo de un arbol de clasificacion
Al igual que en el ejercicio anterior, se repite la importancia del pais, si realiza negocios con una asociacion y/o cooperativa, variables asociadas con creditos externos y experiencia. Si bien este modelo funciona relativamente mejor que el anterior, su poder predictivo aun es bajo (59.8%)
Figura 23. Importancia relativa de variables en modelo de random forest para prediccion de Exito
Para ilustrar como dichas variables se relacionan con la primera definicion de exito, creamos un tabla de balance para ver si las diferencias son estadisticamente significativas entre estas variables. Como se observa en la siguiente Tabla, hay diferencias significantivas en clientes que optan por un nuevo credito y su disposicion a pagar por capacitacion.
| Media | SD. | Media | SD. | Diff. | p | |
|---|---|---|---|---|---|---|
| Panama | 0.238 | 0.426 | 0.085 | 0.279 | -0.153*** | <0.001 |
| Peru | 0.232 | 0.422 | 0.296 | 0.457 | 0.065** | 0.003 |
| Republica Dominicana | 0.305 | 0.461 | 0.350 | 0.477 | 0.045* | 0.047 |
| Le aprobaron el credito? - No | 0.000 | 0.000 | 0.018 | 0.133 | 0.018*** | <0.001 |
| Le aprobaron el credito? - Si | 0.359 | 0.480 | 0.392 | 0.488 | 0.033 | 0.166 |
| Cuanto estaria dispuesto a pagar por curso? - Moneda Local | 0.394 | 0.489 | 0.462 | 0.499 | 0.068** | 0.005 |
| Cuanto estaria dispuesto a pagar por curso? - Nada | 0.393 | 0.489 | 0.325 | 0.469 | -0.067** | 0.004 |
| Termino de pagar dicho credito? - Actualmente estoy pagando ese credito | 0.301 | 0.459 | 0.322 | 0.468 | 0.021 | 0.351 |
| Termino de pagar dicho credito? - No pague credito | 0.009 | 0.094 | 0.003 | 0.058 | -0.005 | 0.157 |
| Termino de pagar dicho credito? - Ya termine de pagar ese credito | 0.049 | 0.216 | 0.066 | 0.249 | 0.017 | 0.131 |
| Experiencia en el trabajo - Si | 0.273 | 0.446 | 0.275 | 0.447 | 0.002 | 0.939 |
| Experiencia a traves de familia/amigos - Si | 0.547 | 0.498 | 0.497 | 0.500 | -0.049* | 0.043 |
| Experiencia en capacitaciones - Si | 0.030 | 0.171 | 0.019 | 0.137 | -0.011 | 0.143 |
Score Exito
Adicionalmente, utilizamos un score continuo como medida de exito, usando un el siguiente promedio ponderado:
\[ScoreExito_i = \frac{1}{3}MoraPromedio SD_i + \frac{1}{3}\Delta MontoSD_i + \frac{1}{3}\Delta ExcedentesSD_i\] donde MoraPromedioSD se refiere a los dias de mora promedio de cada cliente, estandarizado a nivel pais. Por otro lado, ΔMontoSD y ΔExcedentesSD representan las diferencias del monto y los excedentes del negocio entre primer y ultimo credito, respectivamente, tambien estandarizados por pais. Nos enfocaquremos en los clientes que esten en el top 10% de este puntaje.
En este caso utilizamos un modelo de Random Forest, como fue anteriormente descrito, para predecir esta nueva definicion de exito. En este caso, el modelo alcanza una clasificacion correcta de observaciones de 89.9%. Los resultados de las importancia de los predictores se muestra en la siguiente figura:
Figura 24. Importancia relativa de variables en modelo de Random Forest para prediccion de top 10% de score de exito
En este caso, las variables mas relevantes estan asociadas a la capacidad de ahorro y al conocimiento y manejo del negocio. La siguiente tabla muestra el balance entre los dos grupos:
| Media | SD. | Media | SD. | Diff. | p | |
|---|---|---|---|---|---|---|
| Ahorra usted mensualmente parte de sus ingresos? - No | 0.110 | 0.313 | 0.147 | 0.355 | 0.037 | 0.201 |
| Ahorra usted mensualmente parte de sus ingresos? - Si | 0.266 | 0.442 | 0.276 | 0.448 | 0.010 | 0.791 |
| Usted mantiene un libro con las cuentas de su negocio? - No | 0.421 | 0.494 | 0.331 | 0.472 | -0.090* | 0.023 |
| Usted mantiene un libro con las cuentas de su negocio? - Si | 0.455 | 0.498 | 0.546 | 0.499 | 0.091* | 0.028 |
| Que tan probable cree que las ventas 2023 sean mayores a 2022? - prob 1-3 | 0.027 | 0.162 | 0.025 | 0.155 | -0.002 | 0.859 |
| Que tan probable cree que las ventas 2023 sean mayores a 2022? - prob 4-5 | 0.104 | 0.305 | 0.067 | 0.252 | -0.036+ | 0.087 |
| Que tan probable cree que las ventas 2023 sean mayores a 2022? - prob 6-7 | 0.170 | 0.375 | 0.110 | 0.314 | -0.059* | 0.026 |
| Que tan probable cree que las ventas 2023 sean mayores a 2022? - prob 8-10 | 0.575 | 0.494 | 0.675 | 0.470 | 0.099* | 0.011 |
| Cuanto estaria dispuesto a pagar por tomar un curso de 10 horas? - Moneda Local | 0.424 | 0.494 | 0.466 | 0.500 | 0.042 | 0.305 |
| Cuanto estaria dispuesto a pagar por tomar un curso de 10 horas? - Nada | 0.363 | 0.481 | 0.301 | 0.460 | -0.062 | 0.104 |
| En los ultimos 3 meses usted visito al menos un negocio para ver si estan vendiendo productos nuevos? - No | 0.414 | 0.493 | 0.374 | 0.485 | -0.040 | 0.317 |
| En los ultimos 3 meses usted visito al menos un negocio para ver si estan vendiendo productos nuevos? - No tengo negocio/productor/parcela/tienda similar al mio cerca de mi | 0.029 | 0.167 | 0.031 | 0.173 | 0.002 | 0.897 |
| En los ultimos 3 meses usted visito al menos un negocio para ver si estan vendiendo productos nuevos? - Si | 0.433 | 0.496 | 0.472 | 0.501 | 0.040 | 0.336 |
| Usted sabe que bienes obtiene la mayor ganancia por venta de articulos? - No | 0.128 | 0.334 | 0.104 | 0.307 | -0.024 | 0.352 |
| Usted sabe que bienes obtiene la mayor ganancia por venta de articulos? - Si | 0.748 | 0.434 | 0.773 | 0.420 | 0.025 | 0.470 |
| Tengo dificultad para mantener mi enfoque en proyectos que tardan mas de unos pocos meses en completarse - No es en lo mas minimo como yo | 0.087 | 0.282 | 0.098 | 0.298 | 0.011 | 0.655 |
| Tengo dificultad para mantener mi enfoque en proyectos que tardan mas de unos pocos meses en completarse - No se parece a mi | 0.466 | 0.499 | 0.399 | 0.491 | -0.067+ | 0.099 |
| Tengo dificultad para mantener mi enfoque en proyectos que tardan mas de unos pocos meses en completarse - Se parece a mi | 0.209 | 0.407 | 0.276 | 0.448 | 0.067+ | 0.070 |
| Tengo dificultad para mantener mi enfoque en proyectos que tardan mas de unos pocos meses en completarse - Se parece en algo a mi | 0.174 | 0.379 | 0.147 | 0.355 | -0.026 | 0.371 |
Autoreporte de Exito
Finalmente, utilizamos una medida de autoreporte de exito segun la mismas respuestas de la encuesta. En este caso, creamos una variable binaria que toma el valor de 1 si es que la persona declara que las ventas de su negocio son muy superiores con respecto al primer ano y 0 en otro caso. Al igual que en los modelos anteriores, utilizamos un modelo de Random Forest.
Este modelo clasifica correctamente 81.3% de las observaciones. Como se observa en la siguiente figura, las variables mas predictivas estan asociadas al conocimiento del negocio y las expectativas/aspiraciones de los emprendedores.
Figura 25. Importancia relativa de variables en modelo de Random Forest para prediccion de exito autoreportado
| Media | SD. | Media | SD. | Diff. | p | |
|---|---|---|---|---|---|---|
| Cree usted que en este momento existe suficiente demanda/clientela para su actividad economica? - No | 0.165 | 0.371 | 0.078 | 0.268 | -0.087*** | <0.001 |
| Cree usted que en este momento existe suficiente demanda/clientela para su actividad economica? - No se | 0.037 | 0.189 | 0.019 | 0.138 | -0.018+ | 0.050 |
| Cree usted que en este momento existe suficiente demanda/clientela para su actividad economica? - Si | 0.642 | 0.480 | 0.903 | 0.297 | 0.261*** | <0.001 |
| Usted sabe que bienes obtiene la mayor ganancia por venta de articulos? - No | 0.137 | 0.344 | 0.089 | 0.285 | -0.048** | 0.007 |
| Usted sabe que bienes obtiene la mayor ganancia por venta de articulos? - Si | 0.707 | 0.455 | 0.911 | 0.285 | 0.204*** | <0.001 |
| Cree que las ventas de su negocio en el 2023 seran mayores que las del 2022? - Iguales | 0.113 | 0.317 | 0.089 | 0.285 | -0.024 | 0.162 |
| Cree que las ventas de su negocio en el 2023 seran mayores que las del 2022? - Ligeramente menores | 0.011 | 0.106 | 0.000 | 0.000 | -0.011*** | <0.001 |
| Cree que las ventas de su negocio en el 2023 seran mayores que las del 2022? - Mayores | 0.546 | 0.498 | 0.614 | 0.488 | 0.067* | 0.021 |
| Cree que las ventas de su negocio en el 2023 seran mayores que las del 2022? - Menores | 0.020 | 0.139 | 0.006 | 0.074 | -0.014* | 0.010 |
| Cree que las ventas de su negocio en el 2023 seran mayores que las del 2022? - Muy mayores | 0.104 | 0.306 | 0.264 | 0.441 | 0.160*** | <0.001 |
| Cree que las ventas de su negocio en el 2023 seran mayores que las del 2022? - No se | 0.049 | 0.216 | 0.028 | 0.165 | -0.021* | 0.043 |
| Usted revisa el desempeno financiero de su negocio y analiza donde hay areas de mejora al menos una vez al mes? - No | 0.240 | 0.427 | 0.172 | 0.378 | -0.068** | 0.004 |
| Usted revisa el desempeno financiero de su negocio y analiza donde hay areas de mejora al menos una vez al mes? - Si | 0.604 | 0.489 | 0.828 | 0.378 | 0.224*** | <0.001 |
| Imagine que todo sale bien, que tamano fisico tendria en 5 anos? Mas grande que el actual | 0.545 | 0.498 | 0.467 | 0.500 | -0.078** | 0.009 |
| Imagine que todo sale bien, que tamano fisico tendria en 5 anos? Mas pequeno que el actual | 0.005 | 0.073 | 0.011 | 0.105 | 0.006 | 0.322 |
| Imagine que todo sale bien, que tamano fisico tendria en 5 anos? Mucho mas grande que el actual | 0.265 | 0.441 | 0.478 | 0.500 | 0.213*** | <0.001 |
| Imagine que todo sale bien, que tamano fisico tendria en 5 anos? No tengo un negocio actualmente | 0.134 | 0.341 | 0.008 | 0.091 | -0.126*** | <0.001 |
Perfiles de Clientes
Una pregunta interesante es si existen distintos perfiles de clientes, especialmente relacionados con su definicion de exito. Para analizar estas diferencias, comparamos a los grupos segun sus respuestas a la pregunta acerca de a quien consideran una persona exitosa.
- Crecimiento: “Alguien que tiene estabilidad en su negocio”
- Hogar: “Alguien que tiene estabilidad en su hogar”
- Comunidad: “Alguien que es reconocida en su comunidad”
Para comparar a los, compararemos los resultados de los juegos, creando indices continuos para cada variable, donde la variable asociada a riesgo mide aversion al riesgo (un mayor numero indica menor aversion al riesgo), la variable de perdida mide aversion a la perdida (un mayor numero indica menor aversion a la perdidad), y finalmente la variable honestidad, que mide que tan probable es que un individuo sea deshonesto (un mayor numero indica menor nivel de honestidad).
Como se ve en la siguiente figura, el grupo que tiene una mayor orientacion comunitaria tiene una mayor aversion al riesgo y es ligeramente mas honesto que los otros grupos. Sin embargo, ninguna de estas diferencias son estadisticamente significativas.
Figura 26. Promedio de indices de juego segun grupos de definicion de exito personal
De la misma manera anterior, creamos tres categorias de clientes en base a sus respuestas de que consideran un negocio exitoso:
- Crecimiento: “El negocio ha conseguido crecer”
- Mantener a la familia: “El negocio ha conseguido mantenerse” o “Permite cubrir las necesidad del hogar”
- Comunidad: “Ha generado un cambio positivo en la comunidad” o “Ha generado empleo”
Comparando los distintos grupos segun su definicion de exito de un negocio, observamos patrones similares a los anteriores en terminos de honestidad. En este caso, la diferencia entre el grupo de crecimiento y los otros dos grupos es estadisticamente significativa, mostrando que hay una asociacion positiva entre asociar el exito de un negocio al crecimiento y la deshonestidad.
Figura 27. Promedio de indices de juego segun grupos de definicion de exito del negocio
En cuanto a la sobreposicion de los dos grupos, la siguiente table muestra la relacion entre las dos definiciones de exito. Si bien en las categorias de crecimiento y hogar, la mayoria de los clientes tiene definiciones similares de exito tanto en el ambito personal como de negocios, se observa una alta heterogeneidad entre estas dos perspectivas.
Figura 28. Porcentaje de clientes en categorias de definicion de exito personal respecto a definicion de exito de negocio
Creamos tambien heatmaps para ver las diferencias entre grupos en diversas variables, como aversion al riesgo y la perdida, honestidad, crecimiento del negocio y crecimiento del numero de empleados. Para los grupos de definicion de exito personal, se observa que hay diferencias en riesgo y en el score de exito anteriormente descrito, donde los clientes del grupo Crecimiento tienden a tener un mayor score de exito que los otros dos grupos, y el grupo de Comunidad tiende a ser el mas averso al riesgo.
Figura 29. Heatmap para diferencias en caracteristicas por grupo segun definicion de exito personal
En el caso de los grupos creados en base a la definicion de exito del negocio, observamos que hay diferencias sustantivas en cuanto a crecimiento del negocio y del numero de empleados en el negocio, donde el grupo Crecimiento supera a los otros dos grupos. Al igual como fue descrito anteriormente, se ven diferencias en honestidad y tambien en el score de exito. Cabe notar que tambien se observa una diferencia en dias de mora, donde el grupo Crecimiento tiende a tener un promedio de dias de mora superior a los otros dos grupos.
Figura 30. Heatmap para diferencias en caracteristicas por grupo segun definicion de exito del negocio
University of Texas at Austin, m.bennett@austin.utexas.edu↩︎
University of Texas at Austin, william.fuchs@mccombs.utexas.edu↩︎
Universidad de Navarra, jmillan@…↩︎
Debido a problemas de paralizaciones y cortes de camino durante el trabajo de campo, se tuvo que limitar la muestra original↩︎
Debido a huelgas nacionales en Panama, se tuvo que extender el trabajo de campo a Diciembre y Enero, mientras que Peru cerro la primera semana de Diciembre.↩︎
En este caso, excluimos a clientes con un solo contrato↩︎
En este caso, como el escenario 1 es el mas riesgoso y el escenario 5 es el menos riesgoso, se indexan las opciones segun menor riesgo (1) a mayor riesgo (5)↩︎